查看原文
其他

你好好想想,你真的需要配置中心吗?

code2life why技术 2022-09-23

你好呀,我是歪歪。

周末的时候看到一篇关于配置中心的文章,是真的好。

从分析业界通用方案,到匹配自己的业务场景,最后再到亲自动手造个轮子。而且这个轮子,我去看了代码,代码很简洁,几百行代码就实现了一个配置中心的最核心部分的逻辑。

分享给你,给你提供一个看待“配置中心”的新角度。

原文链接:https://code2life.top

配置中心会有多复杂?

配置中心是微服务系统必不可少的组件之一,乍一看好像没多少技术含量,可是,真的是这样吗?

以Java Spring技术栈为例,主流的配置中心有阿里的Nacos、携程的Apollo、以及Spring Cloud Config Server。我们拆解一下其中共通的技术点:

服务端:

  • 认证和权限控制:某个服务可以拿到哪些Key?人员的增删改查权限如何控制?
  • 存储层的选型:文件系统,Git仓库,数据库?
  • 安全性:传输加TLS,密钥需要落盘加密,本身用来加密密钥的密钥如何安全存储?
  • 高可用、数据一致性:多实例部署,甚至跨区域同步,进而又带来分布式存储一致性问题,如何解决?
  • 版本控制:修改记录需要保留,随时可能回退到历史版本,另外,灰度版本的配置隔离如何实现?
  • ......

客户端:

  • SDK如何兼容不同的技术栈?
  • 大量客户端同时启动,如何做并发控制?同时还要尽可能减少额外的请求,对服务启动时间的负面影响?
  • 如何实现与本地配置的优先级控制、合并、缓存、变化实时感知?
  • ......

看到这里,或许你不会觉得配置中心只是简单的KV存储了。主流的型如Alibaba Nacos,作为一个完善的配置和服务发现组件,已经解决了上述大部分问题。我也曾用Nacos,Nacos非常棒,不过我也逐渐发现了一些局限性:

  • 当你有数十个环境,每个环境有数百个配置的时候,基于图形界面的版本管理会力不从心;
  • Nacos服务的网络、Server、数据库,任何一层出问题,都可能影响大量产线服务;
  • 额外的学习、使用、部署、维护成本,服务启动的额外性能开销;
  • 发生过一次产线事故,后来分析是因为Spring Cloud Nacos在刷新配置的时候,可能导致Bean Refresh死锁;
  • 不支持新版本的SpringBoot/SpringCloud,在SpringBoot 2.3.0.M1之后直接报错(这个问题存在很久了,我在Github提了一个Pull Request修复该问题,多日没有收到答复 https://github.com/nacos-group/nacos-spring-boot-project/pull/189)

挥下奥卡姆剃刀吧,或许你不需要如此复杂的方案!

一行代码实现动态配置

我萌生了一个朴素的想法:

既然配置原本就是单纯的文件,那么文件变化时,重新加载对应的Spring Bean不就行了吗?

于是,我开发了一个Spring Boot的配置热重载库,已发布到Maven中心仓库,Github开源仓库地址:

https://github.com/Code2Life/spring-boot-dynamic-config。

话不多说,先看效果。

这个库的使用方式极其简单:只要在注有@Value/@ConfigurationProperties的类上,加上@DynamicConfig注解即可。

实现原理

我读了一些Nacos、Spring Boot、Spring Cloud的相关源码后,发现实现热重载配置有两类方案:

  • 直接基于Spring/SpringBoot,通过自定义Bean的加载和PostProcessor机制开一个口子来实现;
  • 二是基于Spring Cloud,本身就直接支持了动态配置。

我不想依赖Spring Cloud的任何组件,选择了实现难度更大的第一类方案,更难是因为单纯的Spring Boot没有Spring Cloud Starter的父Context和@RefreshScope注解,不能直接destroy原来的Bean,refresh一个新Bean出来,得“飞行中换引擎”。

文件变化监听

第一步,从Environment Bean的PropertySources里,把文件配置的PropertySource给揪出来。

// 需要先实现EnvironmentAware接口或自动装配StandardEnvironment
MutablePropertySources propertySources = environment.getPropertySources();
for (PropertySource<?> ps : propertySources) {
    boolean isFilePropSource = isFromConfigFile(ps);
    if (isFilePropSource) {
        // 找到配置文件的PropertySource
    }
}

第二步,用Java NIO的Watch API监听配置目录。

说到这个第二步,有个小坑,可以看看这篇文章《麻了,被JDK的这个BUG秀麻了!

watchService = FileSystems.getDefault().newWatchService();
Paths.get(configLocation).register(watchService, StandardWatchEventKinds.ENTRY_MODIFY, StandardWatchEventKinds.ENTRY_CREATE);
WatchKey key;
while ((key = watchService.take()) != null) {
    for (WatchEvent<?> event : key.pollEvents()) {
        reloadChangedFile(event)
    }
    key.reset();
}

第三步,如果配置文件变了,把原来的PropertySource对象replace成重新创建出来的。

propertySources.replace(filePropertySourceName, newPropertySource);

// 上述代码只是一些示意片段,完整的实现参考在 DynamicConfigPropertiesWatcher 类

至此,我们用数十行代码,已经实现了动态的Environment Bean,用getProperty()获得的结果已经是动态的了。

Spring Boot开发者一般是在Bean中使用@Value、@ConfigurationProperties来注入配置内容的,因此,原始的配置值已经分散IoC容器里各个相关的Bean中,我们还需要更进一步,在发生变化的同时,把这些Spring Context碗里相关的 bean 再揪出来,偷梁换柱。

所以还得修改Spring Bean的属性。

  • BeanPostProcessor切入Spring Bean加载流程,筛选出需要热重载Bean,完整代码在DynamicConfigBeanPostProcessor类。
  • 接到配置变化通知时,开始移花接木,完整代码在ConfigurationChangedEventHandler类。

遇到的问题

因为要处理许多异常情况、兼容性问题等等,遇到了这两个问题:

  • Linux软链接/Windows快捷方式文件,无法用JDK的WatchService监听。于是加了一个兜底策略:轮询文件的上次修改时间;
  • @ConfigurationProperties类/嵌套类中如果有Map属性,Spring Boot的行为是做Merge Keys,而不是清空原有的Keys。我稍微改了一下,让最外层的Map变成清空策略;
  • Spring Boot 从2.0到现在2.5,有一些核心类发生了变化,PropertySource的命名也有变化,做了一些兼容,而Spring Boot 1.x的版本差别太大无法兼容了。

生产环境

读到这里,或许你会质疑,这样做在本地开发没问题,但直接用文件的方式来管理开发/产线环境的配置,不是在开倒车吗?难道部署100个实例,要去100台机器上改配置文件?

当然不是。

对配置文件的修改,一定,一定,一定要在Git仓库中,最好是独立于代码仓库之外的配置仓库。

为什么要用Git管理配置?

我参与了数十个Spring Cloud服务在全球十几个数据中心的容器化部署和运维,深刻体会了配置管理中的痛点。

我们从相对简单的SpringCloud Config,换到功能复杂的Nacos,都没有解决掉本质的问题:

应用配置是DevOps的一环,本应该和其他环节一样,通过GitOps的持续交付流水线实现自动化,不是去登录任何一个系统去输入任何一行配置。

我们设想一个场景,你作为一名开发,现在想更新一行产线配置。

Nacos的工作流是什么样的呢?

  • 写一个部署文档或者发邮件告诉运维同事,要做一个什么样的修改;
  • 运维同事收到邮件,找你开会确认;
  • 上线期间,运维同事登录Nacos,找到对应的Namespace和DataID,点击“编辑”按钮;
  • 你告诉运维要改的在哪一行,运维同事帮你修改好,点击“发布”按钮;
  • 测完预上线环境,告诉运维同事没问题可以发布到产线了,运维再去手工操作上述步骤。

Git的工作流是怎么样的呢?

  • 使用你喜欢的IDE打开你的应用配置仓库(这个仓库仅维护该应用服务的非敏感配置);
  • 你改完后提交一个合并请求给领导/运维,同事确认无误点击合并,自动触发Pipeline实现配置上线,是哪个分支哪个环境就立即生效。

你不需要登录任何“配置管理系统。

你的运维同事不需要敲N下键盘、点N次鼠标。

你不需要发邮件、写文档。

甚至不需要和领导/运维同事发消息,整个过程就如丝般顺滑的在Git上完成了。

如果是开发环境,审批和走查流程灵活一些的话,配置Push到Git的开发分支,自动触发CI Pipeline,喝口水就生效了。

从这个场景可以看出,维护配置的职责交给Git,有很多好处。

  • 维护期间,可以利用Git管理系统的权限机制,实现对谁可以提交,如何Review,谁可以合并到产线等等细粒度控制;
  • Git本身具备完善的持续集成/持续交付(CI/CD)生态,通过触发CI/CD Pipeline,可以做到配置的秒级上线,跨区域同步上线;
  • Git的版本控制能力极强,把配置文件从GUI系统放回到Git,是配置变得复杂之后的必然选择;
  • 可以用你喜欢的任何编辑器或者IDE,甚至是Git管理系统自带的Web IDE都可以,语法检查也有了;
  • 非常灵活,可以使用模板引擎生成配置,甚至自己开发DSL,这些都可以集成到CI/CD Pipeline中。

读到这里,或许你还有疑问:Git仓库里的配置内容,怎么就通过一个神奇的流水线,“变”到产线的那么多服务器的文件系统里面呢?

还有在Git里面,肯定不能维护产线密钥,怎么办呢?

Kubernetes的魔法

复杂的分布式系统,离不开基础平台的支持,Kubernetes就是这样一个业界标准级的云原生操作系统。

上一节说的神奇的流水线,并不是把文件拷贝到产线机器上,而仅仅是调用了一个HTTPS请求,来更新Kubernetes ConfigMap资源。

我们先回头看下一开始提的配置中心的技术难点,是怎么被Kubernetes ConfigMap/Secret功能完美解决的。

服务端:

  • 认证和权限控制:Kubernetes天然的namespace隔离 + RBAC授权机制,读写权限可以控制到单个文件的粒度;
  • 存储层的选型:职责分离 —— 维护期间在Git,运行期间在Kubernetes背后的etcd,由CI/CD Pipeline自动同步Git到集群。既易维护,又保持了K-V存储服务的架构简单;
  • 安全性:Kubernetes天然的TLS双向认证体系,传输是安全的。另外,Kubernetes Secret天然支持云服务商的KMS集成,更严格的权限控制,所有的密钥是单独管理、单独挂载到服务运行实例上的,压根不会出现在Git中;
  • 高可用、数据一致性:背后的ectd集群使用Raft算法保障一致性。虽然etcd是CAP取CP,但即使整个K8S集群不可用,也不会影响任何已经运行的服务,因为ConfigMap/Secret早已在初始化Pod的容器阶段,就挂载成了普通的文件/环境变量;
  • 版本控制:运行期etcd只保留个别历史版本,完善的版本管理职责,转移给了Git这样一个天然的版本控制系统。

而对于客户端:文件/环境变量就是最原始的配置方式,应用层没有任何额外性能开销和学习使用成本,也天然兼容任何现有的技术栈,只需要在文件变化时在应用层做一次reload即可。

主要特别说明一下的是:每个K8S集群节点上运行的Kubelet,虽然会Watch资源的实时变化,但真正的更新是在1分钟的同步周期做的,也就是说配置修改在1分钟内会在所有运行实例中生效。这个机制是对Kubernetes API Server的请求削峰和保护,对于小型集群可以在Kubelet的启动参数减小“syncFrequency”的默认时间,加速配置生效。

下面是在Kubernetes中使用的Yaml示例片段:

# 1. 前提: 在Jenkins/Argo CD/Github Actions中,
#    创建Config Git Repo到Kubernetes ConfigMap的同步Pipeline

# 2. 在声明的K8S Deployment中,
#    添加环境变量 SPRING_CONFIG_LOCATION
#    指向Config Map mountPath,注意需要'/'结尾

kind: Deployment
apiVersion: apps/v1
metadata:
spec:
  template:
    spec:
      volumes:
        - name: conf-path
          configMap:
            name: your-app-config 
      containers:
        - name: app-container
          image: '<your-image-name>'
          env:
            - name: SPRING_CONFIG_LOCATION
              value: /config/
          # Spring支持 Relaxing Binding,使用 -jar xxx.jar --spring.config.location 也可以
          command: ["java""-jar""your-spring-boot-app.jar"]
          volumeMounts:
            - name: conf-path
              mountPath: /config

总结与思考

本文主要介绍了我最近开发的一个实现Spring Boot动态配置的轻量级库:Spring Boot Dynamic Config,以及为什么结合Git + Kubernetes的配置管理模式,优于其他配置管理组件。

使用场景

技术是解决问题的,脱离问题场景做选择是没有意义的。

  • Nacos适合有历史包袱的项目、未容器化的项目,应用层不得不借助Nacos这类组件,实现一些通用能力。
  • 对于已经上了Kubernetes的系统,结合DevOps的持续交付流水线,使用Spring Boot Dynamic Config是最简洁高效的解决方案。
  • 当然,对于简单的场景,在3,5台机器上直接跑个位数的服务,即使没有容器化、没有DevOps流水线,直接SSH到服务器去改配置文件,这时用Dynamic Config也是比单独部署配置服务更简单的一条路。

少即是多

开发这个库的动机,是在参与数十个微服务应用的DevOps工作时,看着运维同事深陷大量环境和服务的配置管理泥坑,我开始反思一个问题:

配置管理有必要如此复杂吗?

当我们已经有了Git、有了Kubernetes,那么,Git不就是那个最完美的配置管理系统吗?

Kubernetes不就是那个最完美的配置中心吗?

踏破铁鞋无觅处,得来全不费工夫。

Keep it simple and stupid !

Kubernetes + X

Kubernetes + Git解决了复杂微服务系统的配置管理问题。其实,Kubernetes + X的组合几乎可以解决掉服务治理的所有问题。

而开发人员很少了解Kubernetes这样强大的云原生平台,认为Kubernetes仅仅是部署运维的工具。

我以后还会再写一些文章来说明:为什么在Kubernetes体系下,许多组件和轮子是不必要的,包括主流的Spring Cloud生态的诸多组件。

之前也曾写过一个简单的回答:

https://www.zhihu.com/question/430048535/answer/1582533126

有兴趣的可以去看看,我这里只是截个结论:

项目的开发历程

为什么造这个轮子?

Kubernetes ConfigMap/Secret已经是主流的云原生配置方案,而Java Spring生态缺少一个动态感知ConfigMap/Secret变化的轻量级库。

Spring Cloud Kubernetes (https://spring.io/projects/spring-cloud-kubernetes) 这个库采用直接调用Kubernetes API的方案,一方面这个库过重了;另一方面与Kubernetes耦合过于紧密,启动服务还需要访问Kubernetes API的权限,不合适。

效果如何?

这个小轮子一共花了一周多的业余时间,一小半的时间在解决疑难杂症,还有一小半的时间在写文档、改进单元测试和代码质量。

最终,精简到仅有600多行实现代码,无任何除了Spring Boot核心库以外的依赖。同时开发了400多行单元测试,测试覆盖率95%,CodeBeat代码质量评分在A/B级之间。

最后,再贴一下项目地址,感兴趣的朋友可以去看看源码:

https://github.com/Code2Life/spring-boot-dynamic-config

荒腔走板

2022 年下半年的第一天,我和 MX 同学去听了野孩子乐队的现场。其实还是期待了很长时间的,终于在周五的晚上成功赴约了。

下半年的第二天,回了一趟老家。

在十八线小县城,这次来去匆匆,回去待的时间加起来也没有超过 24 小时。

我以前说离家近的好处就是可以随时回家,但是除了国庆,春节这样的长假外,我好像也没回去过。

虽然这样说,但是“离家近,离家人近”给人的感觉还是很踏实的,有一种归属感。

漂泊的对立面,就是归属。

虽然我老家不是成都,但是我对成都这座城市就非常的有归属感。

这份归属感它来源于离家人很近、和 MX 同学在一起、偶尔临时起意就能和朋友相聚一堂、消费不高、房租平价、饮食相符,还有周围被四川话围绕的感觉。

哦,对了。

因为听了野孩子的现场,心有所感,所以从老家回成都的动车上,发了一篇关于乐队和摇滚的文章《暂时还没想好取什么标题》

列车上的网络非常不好,写作体验也很不好,磕磕绊绊也算是写完了。写之前先想题目,想了几分钟真的不知道取什么标题,于是就先写下“暂时还没想好取什么标题”。

写完之后还是想不到,于是索性就用这个标题发文了。

现在我想到了一个标题,就是文章里面出现的一句歌词:山川湖海,厨房与爱。

你可以看看。

最近歌荒,也可以把你喜欢的歌留在那篇文章的评论区,推荐给我,谢谢。

··················END················

推荐👍不要扫描来路不明的二维码!

推荐👍线程崩了,为什么不会导致 JVM 崩溃呢?

推荐👍 :两年半经验,面10个公司,经28轮面试,拿9个offer,涨麻了!

推荐👍 :JDK的BUG!

推荐👍 :2021,我这一年。

你好呀,我是歪歪。我没进过一线大厂,没创过业,也没写过书,更不是技术专家,所以也没有什么亮眼的title。

当年高考,随缘调剂到了某二本院校计算机专业。纯属误打误撞,进入程序员的行列,之后开始了运气爆棚的程序员之路。

说起程序员之路还是有点意思,可以点击蓝字,查看我的程序员之路

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存